Learning fair graph representations for downstream applications is becoming increasingly important, but existing work has mostly focused on improving fairness at the global level by either modifying the graph structure or objective function without taking into account the local neighborhood of a node. In this work, we formally introduce the notion of neighborhood fairness and develop a computational framework for learning such locally fair embeddings. We argue that the notion of neighborhood fairness is more appropriate since GNN-based models operate at the local neighborhood level of a node. Our neighborhood fairness framework has two main components that are flexible for learning fair graph representations from arbitrary data: the first aims to construct fair neighborhoods for any arbitrary node in a graph and the second enables adaption of these fair neighborhoods to better capture certain application or data-dependent constraints, such as allowing neighborhoods to be more biased towards certain attributes or neighbors in the graph.Furthermore, while link prediction has been extensively studied, we are the first to investigate the graph representation learning task of fair link classification. We demonstrate the effectiveness of the proposed neighborhood fairness framework for a variety of graph machine learning tasks including fair link prediction, link classification, and learning fair graph embeddings. Notably, our approach achieves not only better fairness but also increases the accuracy in the majority of cases across a wide variety of graphs, problem settings, and metrics.
translated by 谷歌翻译
图形神经网络(GNNS)已被广泛用于许多域,在这些领域中,数据被表示为图,包括社交网络,推荐系统,生物学,化学等。最近,GNNS的表现力引起了人们的兴趣。已经表明,尽管GNNS在许多应用中取得了有希望的经验结果,但GNN中存在一些局限性,阻碍了他们对某些任务的绩效。例如,由于GNNS更新节点功能主要基于本地信息,因此它们在捕获图中节点之间的长距离依赖性方面具有有限的表达能力。为了解决GNN的一些局限性,最近的几项工作开始探索增强的GNN,并记忆以提高其在相关任务中的表现力。在本文中,我们对现有的记忆启发性GNN的现有文献进行了全面综述。我们通过心理学和神经科学的角度回顾了这些作品,后者已经在生物学大脑中建立了多种记忆系统和机制。我们提出了记忆GNN作品的分类法,以及比较记忆机制的一组标准。我们还提供有关这些作品局限性的重要讨论。最后,我们讨论了该领域的挑战和未来方向。
translated by 谷歌翻译
In this work, we introduce a hypergraph representation learning framework called Hypergraph Neural Networks (HNN) that jointly learns hyperedge embeddings along with a set of hyperedge-dependent embeddings for each node in the hypergraph. HNN derives multiple embeddings per node in the hypergraph where each embedding for a node is dependent on a specific hyperedge of that node. Notably, HNN is accurate, data-efficient, flexible with many interchangeable components, and useful for a wide range of hypergraph learning tasks. We evaluate the effectiveness of the HNN framework for hyperedge prediction and hypergraph node classification. We find that HNN achieves an overall mean gain of 7.72% and 11.37% across all baseline models and graphs for hyperedge prediction and hypergraph node classification, respectively.
translated by 谷歌翻译
A "heart attack" or myocardial infarction (MI), occurs when an artery supplying blood to the heart is abruptly occluded. The "gold standard" method for imaging MI is Cardiovascular Magnetic Resonance Imaging (MRI), with intravenously administered gadolinium-based contrast (late gadolinium enhancement). However, no "gold standard" fully automated method for the quantification of MI exists. In this work, we propose an end-to-end fully automatic system (MyI-Net) for the detection and quantification of MI in MRI images. This has the potential to reduce the uncertainty due to the technical variability across labs and inherent problems of the data and labels. Our system consists of four processing stages designed to maintain the flow of information across scales. First, features from raw MRI images are generated using feature extractors built on ResNet and MoblieNet architectures. This is followed by the Atrous Spatial Pyramid Pooling (ASPP) to produce spatial information at different scales to preserve more image context. High-level features from ASPP and initial low-level features are concatenated at the third stage and then passed to the fourth stage where spatial information is recovered via up-sampling to produce final image segmentation output into: i) background, ii) heart muscle, iii) blood and iv) scar areas. New models were compared with state-of-art models and manual quantification. Our models showed favorable performance in global segmentation and scar tissue detection relative to state-of-the-art work, including a four-fold better performance in matching scar pixels to contours produced by clinicians.
translated by 谷歌翻译
现在,具有成本效益的深度和红外传感器作为常规RGB传感器的替代方案已成为现实,并且在自主导航和遥控传感等域中具有比RGB的优势。因此,建立计算机视觉和深度学习系统以进行深度和红外数据至关重要。但是,仍然缺乏针对这些模式的大型标签数据集。在这种情况下,将知识从源模式(RGB)的良好标记的大型数据集训练的神经网络转移到在目标模式(深度,红外等)上工作的神经网络具有很大价值。出于内存和隐私等原因,可能无法访问源数据,并且知识转移需要仅与源模型一起使用。我们描述了一个有效的解决方案,插座:无源的跨模式知识转移,用于将知识从一个源模式转移到不同目标模式的具有挑战性的任务,而无需访问与任务相关的源数据。该框架使用配对的任务 - IRRELELERVANT数据以及将目标特征的平均值和方差与源模型中存在的批处理统计信息匹配,从而减少了模态差距。我们通过广泛的实验表明,我们的方法明显优于无法解释模式差距的分类任务的现有无源方法。
translated by 谷歌翻译
给定图形学习任务,例如链接预测,在新的图数据集上,我们如何自动选择最佳方法及其超参数(集体称为模型)?图形学习的模型选择在很大程度上是临时的。一种典型的方法是将流行方法应用于新数据集,但这通常是次优的。另一方面,系统比较新图上的模型迅速变得太成本过高,甚至不切实际。在这项工作中,我们为自动图机学习开发了第一种称为AutoGML的元学习方法,该方法利用了基准图数据集中大量现有方法的先前性能,并携带此先前的经验以自动选择有效的有效用于新图的模型,无需任何模型培训或评估。为了捕获来自不同领域的图形之间的相似性,我们引入了量化图形结构特征的专业元图特征。然后,我们设计了一个代表模型和图形之间关系的元图,并开发了在元图上运行的图形元学习器,该图估计了每个模型与不同图的相关性。通过广泛的实验,我们表明,使用AutoGML选择新图的方法显着优于始终应用流行方法以及几个现有的元学习者,同时在测试时非常快。
translated by 谷歌翻译
网络科学和技术的快速发展取决于可共享的数据集。当前,没有用于报告和共享网络数据集的标准实践。一些网络数据集提供商仅共享链接,而另一些网络数据集提供商提供了一些上下文或基本统计信息。结果,关键信息可能无意间删除,网络数据集消费者可能会误解或忽略关键方面。使用网络数据集不适当地导致严重的后果(例如,歧视),尤其是当将网络上的机器学习模型部署在高维护域中时。挑战出现,因为网络通常在不同的领域(例如网络科学,物理等)上使用并具有复杂的结构。为了促进网络数据集提供商和消费者之间的通信,我们提出了网络报告。网络报告是一个结构化的描述,总结和上下文化网络数据集。网络报告从先前的工作中扩展了数据集报告(例如,数据集的数据表)的想法,其中包含非i.i.d的网络特定说明。自然,人口统计信息,网络特征等。我们希望网络报告鼓励不同领域的网络研发透明度和问责制。
translated by 谷歌翻译
给定实体及其在Web数据中的交互,可能在不同的时间发生,我们如何找到实体社区并跟踪其演变?在本文中,我们从图形群集的角度处理这项重要任务。最近,通过深层聚类方法,已经实现了各个领域的最新聚类性能。特别是,深图聚类(DGC)方法通过学习节点表示和群集分配在关节优化框架中成功扩展到图形结构的数据。尽管建模选择有所不同(例如,编码器架构),但现有的DGC方法主要基于自动编码器,并使用相同的群集目标和相对较小的适应性。同样,尽管许多现实世界图都是动态的,但以前的DGC方法仅被视为静态图。在这项工作中,我们开发了CGC,这是一个新颖的端到端图形聚类框架,其与现有方法的根本不同。 CGC在对比度图学习框架中学习节点嵌入和群集分配,在多级别方案中仔细选择了正面和负样本,以反映层次结构的社区结构和网络同质。此外,我们将CGC扩展到时间不断发展的数据,其中时间图以增量学习方式执行,并具有检测更改点的能力。对现实世界图的广泛评估表明,所提出的CGC始终优于现有方法。
translated by 谷歌翻译
在本文中,我们介绍了对非对称确定点处理(NDPP)的在线和流媒体地图推断和学习问题,其中数据点以任意顺序到达,并且算法被约束以使用单次通过数据以及子线性存储器。在线设置有额外要求在任何时间点维护有效的解决方案。为了解决这些新问题,我们提出了具有理论担保的算法,在几个真实的数据集中评估它们,并显示它们对最先进的离线算法提供了可比的性能,该算法将整个数据存储在内存中并采取多次传递超过它。
translated by 谷歌翻译
饮食管理是管理糖尿病等慢性病的关键。自动化食品推荐系统可以通过提供符合用户的营养目标和食物偏好的膳食建议提供帮助。当前推荐系统缺乏缺乏准确性,部分是由于缺乏对食物偏好的知识,即食品用户可以常常吃。在这项工作中,我们提出了一种从食物日志中学习食物偏好的方法,是关于用户饮食习惯的全面但嘈杂的信息来源。我们还介绍了伴随的指标。该方法生成并比较Word Embeddings以识别每个食物条目的父食品类别,然后计算最受欢迎的。我们所提出的方法识别用户十个最常见的食物的82%。我们的方法是公开推出的(https://github.com/aametwally/learningfoodpreferences)
translated by 谷歌翻译